ARIMA এবং SARIMA মডেল হল টাইম সিরিজ ডেটার বিশ্লেষণের জন্য ব্যবহৃত দুটি জনপ্রিয় পরিসংখ্যানগত মডেল। এই মডেলগুলি ভবিষ্যদ্বাণী করার জন্য ডেটার আগের মান এবং প্রবণতাগুলির উপর ভিত্তি করে কাজ করে। তারা বিশেষ করে ব্যবহৃত হয় যখন ডেটায় মৌসুমি (seasonality) বা ট্রেন্ড (trend) থাকে।
ARIMA (AutoRegressive Integrated Moving Average)
ARIMA মডেল একটি পরিসংখ্যানিক মডেল যা টাইম সিরিজ ডেটার ভবিষ্যদ্বাণী করতে ব্যবহৃত হয়। ARIMA এর মাধ্যমে আমরা আগের পর্যায়গুলির উপর ভিত্তি করে ভবিষ্যতের মান অনুমান করতে পারি। এটি তিনটি প্রধান অংশে বিভক্ত:
- AR (AutoRegressive):
- AR অংশটি "অটো-রিগ্রেশন" দ্বারা পরিচালিত হয়, যার মানে হলো, বর্তমান মান আগের কিছু পর্যায়ের (lagged) মানের উপর নির্ভর করে। এটি সাধারণত ডেলি ল্যাগ (delay) প্যারামিটার দ্বারা নিয়ন্ত্রিত।
- এর অর্থ, বর্তমান পর্যায়টি আগের সময়ের মানের সাথে সম্পর্কিত থাকে।
- I (Integrated):
- Integrated অংশটি টাইম সিরিজের ট্রেন্ড (trend) দূর করতে ব্যবহৃত হয়। এর মাধ্যমে ডেটাকে স্থিতিশীল (stationary) করা হয়, যেমন ডেটাতে কোনও স্পষ্ট ট্রেন্ড থাকলে তা বাদ দেয়া। এটি ডিফারেন্সিং প্যারামিটার দ্বারা নিয়ন্ত্রিত হয়।
- অর্থাৎ, এটি ডেটাতে তারতম্য পরিবর্তন (differencing) প্রয়োগ করে যেন সিজনাল বা ট্রেন্ডের প্রভাব কমে যায়।
- MA (Moving Average):
- MA অংশটি "মুভিং এভারেজ" এর মাধ্যমে পূর্ববর্তী ত্রুটি (errors) বা শঙ্কা (residuals) বিশ্লেষণ করে বর্তমান পর্যায়টি ভবিষ্যদ্বাণী করতে সহায়ক হয়।
- এটি এর মাধ্যমে নিয়ন্ত্রিত হয়, যেখানে হলো পরবর্তী পর্যায়ের ত্রুটি সংখ্যা।
ARIMA মডেল সাধারণত আকারে লেখা হয়, যেখানে:
- হলো আটো-রিগ্রেশন ল্যাগের সংখ্যা
- হলো ডিফারেন্সিংয়ের পরিমাণ (ট্রেন্ড দূর করতে)
- হলো মুভিং এভারেজের ল্যাগের সংখ্যা
ARIMA মডেল উদাহরণ:
ধরা যাক, আমাদের কাছে একটি টাইম সিরিজ ডেটা রয়েছে, যেখানে ডেটা কোন ট্রেন্ড অথবা মৌসুমি বৈশিষ্ট্য নেই। তাহলে আমরা ARIMA(1, 1, 1) মডেলটি ব্যবহার করতে পারি, যেখানে:
- 1 আটো-রিগ্রেশন (AR) ল্যাগ
- 1 ডিফারেন্সিং (I)
- 1 মুভিং এভারেজ (MA) ল্যাগ
SARIMA (Seasonal ARIMA)
SARIMA (Seasonal ARIMA) হল ARIMA মডেলের একটি উন্নত সংস্করণ যা টাইম সিরিজ ডেটার মৌসুমি বৈশিষ্ট্য বা seasonality বিশ্লেষণ করতে ব্যবহৃত হয়। SARIMA মডেলটি মৌসুমি ডেটার ট্রেন্ড এবং শঙ্কাকে আরও ভালভাবে ধরতে সাহায্য করে।
SARIMA মডেলটি ARIMA মডেলের মতোই তিনটি উপাদান ব্যবহার করে, তবে এখানে মৌসুমি (seasonal) উপাদানও যোগ করা হয়।
SARIMA মডেলের গঠন:
SARIMA মডেলটি সাধারণত আকারে লেখা হয়, যেখানে:
- হল ARIMA অংশের প্যারামিটার (অর্থাৎ আগের ARIMA মডেলের মতো)
- হল মৌসুমি উপাদানসমূহের প্যারামিটার:
- হল মৌসুমি আটো-রিগ্রেশন (seasonal AR)
- হল মৌসুমি ডিফারেন্সিং (seasonal differencing)
- হল মৌসুমি মুভিং এভারেজ (seasonal MA)
- হল মৌসুমের দৈর্ঘ্য, যেমন মাসে বা বছরে একাধিক মৌসুম থাকতে পারে। উদাহরণস্বরূপ, যদি আপনার ডেটাতে বছরে ৪টি মৌসুম থাকে, তবে হবে।
SARIMA মডেল উদাহরণ:
ধরা যাক, আমাদের কাছে একটি টাইম সিরিজ ডেটা রয়েছে যেখানে মৌসুমি বৈশিষ্ট্য রয়েছে, যেমন মাসিক বিক্রয় ডেটা। আমরা SARIMA(1, 1, 1)(1, 1, 1, 12) মডেলটি ব্যবহার করতে পারি:
- 1 আটো-রিগ্রেশন (AR)
- 1 ডিফারেন্সিং (I)
- 1 মুভিং এভারেজ (MA)
- 1 মৌসুমি আটো-রিগ্রেশন (seasonal AR)
- 1 মৌসুমি ডিফারেন্সিং (seasonal differencing)
- 1 মৌসুমি মুভিং এভারেজ (seasonal MA)
- 12 মৌসুম (মাসিক ডেটার জন্য 12)
এটি এমন একটি মডেল যা সিজনাল এবং ট্রেন্ডের পরিবর্তন উভয়কেই যথাযথভাবে বিশ্লেষণ এবং পূর্বাভাস করতে সাহায্য করে।
ARIMA এবং SARIMA মডেলগুলির তুলনা
| বৈশিষ্ট্য | ARIMA | SARIMA |
|---|---|---|
| মৌসুমি প্রভাব | মৌসুমি প্রভাব গ্রহণ করে না | মৌসুমি প্রভাব (seasonality) নিয়ন্ত্রণ করে |
| প্যারামিটার | ||
| ডেটা প্রকার | সাধারণ টাইম সিরিজ ডেটা | মৌসুমি টাইম সিরিজ ডেটা |
| ব্যবহার | যখন মৌসুমি প্রভাব থাকে না | যখন মৌসুমি প্রভাব থাকে |
সারাংশ
- ARIMA মডেল সাধারণত এমন টাইম সিরিজ ডেটার জন্য ব্যবহৃত হয়, যেখানে মৌসুমি বৈশিষ্ট্য নেই এবং কিছু ট্রেন্ড বা শঙ্কা থাকতে পারে।
- SARIMA মডেল ARIMA এর উন্নত সংস্করণ এবং মৌসুমি বৈশিষ্ট্য সম্পন্ন টাইম সিরিজ ডেটার জন্য ব্যবহৃত হয়, যেমন মাসিক বা বার্ষিক ডেটা যেখানে মৌসুমী পরিবর্তন রয়েছে।
এই মডেলগুলি টাইম সিরিজ ডেটার ভবিষ্যদ্বাণী বা পূর্বাভাস তৈরিতে খুবই কার্যকরী।
Read more